﻿Curs%11% Tehnici'u)le'în'realizarea'proiectului' Definiția%ontologiei% • O%ontologie%este%un%set%de%termeni%referitori%la% un%domeniu%de%interes,%asociați%cu%definiții% într-o%limbă%naturală%(de%exemplu,%engleza),%și% care%au%relații%formale%și%constrângeri%ce%sunt% uClizate%de%oameni%în%munca%lor%și,%eventual,% de%programe%de%calculator %% Aprox %din:%Ed%Hovy%(1998) %Combining%and%Standardizing%Large-Scale,%PracCcal% Ontologies%for%Machine%TranslaCon%and%Other%Uses% %LREC,%Granada% Extragerea'de'ontologii'din'texte' Determinarea%relației%de%hyponimie% The$bow$lute,$such$as$the$Bambara$ ndang,$is$plucked$and$has$an$individual$ curved$neck$for$each$string % % Lăuta$cu$arc,$precum$Bambara$ndang,$ este$în>nsă$și$are$un$gât$curbat$ individual$pentru$fiecare$strună $$ Din:%M %Hearst%(1992) %AutomaCc%AcquisiCon%of% Hyponyms%from%Large%Text%Corpora,%ACL% PaXernuri%lexicale% NP0% %such%as%{NP1,%NP2% % % % %(and%|%or)}%NPn% 0 1 2 n implică% for%all%NPi%1% % hyponym("author",%"Herrick")% hyponym("author",%"Goldsmith")% hyponym("author",%"Shakespeare")% % PaXernuri%lexicale% NP%{,%NP}%*%{,}%or%other%NP% %% Bruises,$wounds,$broken$bones$or$other$ injuries$ $ $ $ =>% hyponym("bruise",%"injury")% hyponym%("wound",%"injury%“)% hyponym("broken%bone",%"injury")%% PaXernuri%lexicale% NP%{,%NP}*%{,}%and%other%NP% %% $temples,$treasuries,$and$other$ important$civic$buildings $ %% %% =>% hyponym("temple",%"civic%building")% hyponym("treasury%",%"civic%building")%% PaXernuri%lexicale% NP%{,}%including%{NP%{,}}%*%{or%|%and}%NP% %% All$common-law$countries,$including$ Canada$and$England$ $ =>% hyponym("Canada",%"common-law%country")% hyponym%("England",%"common-law%country")%% PaXernuri%lexicale% NP%{,}%especially%{NP%,}*%{or]%and}%NP% %% $ $ $most$European$countries,$especially$ France,$England,$and$Spain $ =>% hyponym("France",%"European%country")% hyponym("England",%"European%country")% hyponym("Spain",%"European%country")%% Cum%se%pot%găsi%noi%paXernuri?% 1 Decideți%asupra%unei%relații%lexicale,%R,%care%este%de%interes,% de%exemplu,%"grup%-%membru"%% 2 Colectați%o%listă%de%termeni%pentru%care%această%relație%este% cunoscută,%de%exemplu,%"Anglia%-%țară" % – Lista%poate%fi%găsită%automat%prin%bootstrapping%pornind%de%la% paXernuri%găsite%manual%sau%prin%bootstrapping%de%la%un%lexic% sau%o%bază%de%cunoșCnțe%existente %% 3 Găsiți%apariții%în%corpus%în%care%aceste%expresii%apar%sintacCc% una%lângă%cealaltă%și%înregistrați%aceste%contexte %% 4 Găsiți%părțile%comune%ale%acestor%contexte%și%ipotezați%că% acestea%formează%Cpare%care%indică%relația%de%interes %% 5 Odată%ce%un%paXern%nou%a%fost%idenCficat,%uClizați-l%pentru% a%aduna%mai%multe%exemple%ale%relației%țintă%și%conCnuați%cu% Pasul%2 %% Cum%se%pot%găsi%noi%paXernuri?% 1 %Antrenare:%% (a)%Exportați%exemple%din%toate%perechile%de%hipernime%(perechi%de%cuvinte% aflate%într-o%relație%hipernimie%/%hiponimie)%din%WordNet %% (b)%Pentru%fiecare%pereche%hipernimică,%găsiți%fraze%în%care%apar%ambele%cuvinte %% (c)%Parsați%frazele%și%extrageți%automat%paXernuri%din%arborele%de%parsare,%care% reprezintă%indicii%bune%pentru%relația%hipernimică %% (d)%Instruiți%un%clasificator%hipernimic%bazat%pe%aceste%caracterisCci %% 2 %Test:%% (a)%Fiind%dată%o%pereche%de%cuvinte%din%setul%de%testare,%extrageți%caracterisCcile% și%uClizați%clasificatorul%pentru%a%decide%dacă%perechea%de%cuvinte%se%află%în% relația%hipernim%/%hiponim%sau%nu % % Din:%Snow,%Juravsky%and%Ng%(2004) %Learning%syntacCc%paXerns%for% automaCc%hypernym%discovery,%in%NIPS %% PaXernuri%lexico-sintacCce% Toate%căile%minime,%de%lungime%≤%4,%între%oricare%două%substanCve%% dintr-un%arbore%de%dependență% “ such%authors%as%Herrick%and%Shakespeare”%% Trăsăturile%sunt%reprezentate%ca%triplete:%% (word1, CATEGORY1:RELATION:CATEGORY2, word2) unde%word1%și%word2%sunt%rădăcini%de%cuvinte% Generalizarea%paXernurilor:%% notația%dependențelor%exCnse% • Reține%cea%mai%scurtă%cale:%authors$–%Herrick$$ • Adaugă%sateliți:%authors%–%such$$ • Distribuie%legăturile%de%dependență%în%jurul% elementelor%conjuncționate$ Representările%paXernurilor%lui%Hearst% ca%trasee%de%dependență% word1, CATEGORY1:RELATION:CATEGORY2, word2) % • NPX and other NPY : (and,U:PUNC:N),-N:CONJ:N, XY (other,A:MOD:N) • NPX or other NPY : (or,U:PUNC:N),-N:CONJ:N, XY (other,A:MOD:N) • NPY such as NPX: N:PCOMP-N:PREP,such as,such YX as,PREP:MOD:N • Such NPY as NPX: N:PCOMP-N:PREP,as,as,PREP:MOD:N, (such,PREDET:PRE:N) • NPY including NPX: N:OBJ:V,include,include,V:I:C,dummy YX node,dummy node,C:REL:N • NPY , especially NPX: -N:APPO:N,(especially,A:APPO- YX MOD:N) Clasificator% • Intrare:%o%pereche%ordonată%de%cuvinte%% • Ieșire:%o%decizie%binară%cu%privire%la%faptul%dacă% substanCvele%sunt%în%legătură%de%hipernimie%ori% nu%% • CaracterisCci:%căi%(trasee)%pe%care%primul%și% ulCmul%cuvânt%sunt%înlocuite%de%categoria%N% (substanCv)%% • Corpus:%6%milioane%de%fraze%de%șCri% – corpus%parsat%cu%MINIPAR%% – sunt%extrase%toate%perechile%de%substanCve%care%apar% în%aceeași%frază% Clasificator% – 752 311%perechi%de%substanCve%au%fost%eCchetate% drept%Cunoscut-ca-Hipernim%sau%Cunoscut-ca-Non- Hipernim%folosind%WN:%% • o%pereche%de%substanCve%(n1,%n2)%este%eCchetă%Cunoscut-ca- Hipernim'dacă%n2%este%un%strămoș%al%primului%sens%al%lui%n1% în%taxonomia%de%hipernimie%din%WN%și%dacă%relația% hypernym*%din%WN%ține%între%primele%sensuri%ca%substanCve% enumerate%în%WordNet%(care%reprezintă%cele%mai%“frecvent% uClizate"%sensuri%ale%fiecărui%cuvânt)%% • o%pereche%de%substanCve%este%eCchetată%Cunoscut-ca-Non- Hipernim%dacă%ambele%substanCve%sunt%conținute%în%WN,% dar%niciunul%dintre%cuvinte%nu%este%un%strămoș%al%celuilalt%în% taxonomia%hipernimică%din%WN%pentru%orice%sens%al%fiecărui% cuvânt%% Evaluarea%paXernurilor% • Care%dintre%traseele%de%dependență%(paXernuri% lexico-sintacCce)%se%dovedesc%a%fi%caracterisCci%uCle% pentru%clasificatori:%% – a%fost%construit%câte%un%clasificator%binar%pentru%fiecare% paXern:%paXernul%este%reprezentaCv%pentru%a%clasifica%o% pereche%de%substanCve%ca%hipernime%/%hiponime%dacă%și% numai%dacă%paXernul%respecCv%apare%cel%puțin%o%dată% pentru%o%pereche%de%substanCce%care%se%întâmplă%să%fie%în% relația%hipernim%/%hiponim,%conform%WN%% =>%printre%multe%altele,%modelele%găsite%manual%de%Hearst% au%fost%"redescoperite"%% Descoperirea%de%noi%paXernuri% • Alte%paXernuri%de%scor%mare:% NPY like NPX: N:PCOMP-N:PREP,like,like,PREP:MOD:N NPY called NPX: N:DESC:V,call,call,V:VREL:N YX NPX is a NPY: N:S:VBE,be,be,-VBE:PRED:N XY NPX, a NPY (appositive): N:APPO:N XY Clasificarea%hipernimelor%după%paXernuri% MINIPAR% • hXps://gate ac uk/releases/gate-7 0- build4195-ALL/doc/tao/splitch17 html% Combinarea'(fuziunea)'de'ontologii' Fuziunea%de%ontologii%–%definiție% • Procesul%de%fuziune%ontologică%primește%în% intrare%două%(sau%mai%multe)%ontologii%sursă%și% returnează%o%ontologie%care%combină% ontologiile%sursă%date %% Gerd%Stumme,%Alexander%Maedche %Ontology%Merging%for%Federated%Ontologies%% on%the%SemanCc%Web%% Abordări% • Abordările%se%bazează%pe%eurisCci%de%potrivire% sintacCcă%și%semanCcă%care%derivă%din% comportamentul%inginerilor%ontologi%atunci%când% se%confruntă%cu%sarcina%de%a%îmbina%ontologii,%i %e % se%simulează%comportamentul%uman % • Tehnici%staCsCce,%care%judecă%similaritatea% conceptelor%și%asemănarea%brută%a%instanțelor,% prin%metrici%de%șiruri%textuale%și%cunoșCnțe%de% natură%semanCcă %% Viziuni%comune%ori%diferite%asupra% lumii,%combinare%% Ontologie:%definiție%formală% • Definiție:%O%ontologie%(de%bază)%este%un%tuplu% O:%=%(C;%is a;%R;%σ),%unde%C%este%un%set%ale%cărui% elemente%se%numesc%concepte,%is a%este%o% ordine%parțială%pe%C%(adică%o%relație%binară%is a% ⊆%CC%care%este%reflexivă,%tranziCvă%și% anCsimetrică),%R%este%un%set%ale%cărui% elemente%sunt%numite%nume%de%relații%(sau,%pe% scurt,%relații),%iar%σ:%R%à%C+%este%o%funcție%care% atribuie%fiecărui%nume%de%relație%aritatea%sa %% Cum%se%pot%combina%termenii?% • Fiind%dați%doi%termeni,%câte%unul%din%fiecare%ontologie:% – Termenii%sunt%incompaCbili%(i e ,%idenCficarea%acestora%ar% cauza%probleme%de%definire%și%relaționale%între%ceilalți% termeni)%-%caz%în%care:%% (1) unul%dintre%termeni%trebuie%respins%și%nu%trebuie%încorporat,% (2) unul%dintre%termeni%și%alții%care%depind%de%el%trebuie%să%fie% redefiniți,%% (3) trebuie%creată%o%"microteorie"%separată,%în%care%termenii%și%toți% ceilalți%termeni%care%depind%de%ea%există%în%paralel%% (4) poate%fi%încorporată%o%versiune%mai%slabă%a%termenului% infracțional,%fără%definițiile%sau%relațiile%care%au%cauzat% inconsecvența%% SugesCi%de%eurisCci%de%aliniere% 1 %%Potriviri%pe%șiruri%de%litere,%e g :%% – Potriviri%ale%numelor%de%concepte%(cognate$ matching):%nume%suficient%de%asemănătoare%(în% aceeași%limbă)%sunt%dovezi%că%dezvoltatorii%consideră% conceptele%similare %% – Potriviri%în%definiții%(prin%procesare%de%text%și%măsuri% de%suprapuneri):%definiții%similare%în%limbaj%natural%ar% trebui%fie%considerate,%de%asemenea,%dovezi%ale% similarității%conceptelor %% SugesCi%de%eurisCci%de%aliniere% 2 %Potrivirile%ierarhice%exploatează%structura%de% taxonomizare%a%ontologiilor %Ele%includ:%% – Filtrarea%ambiguității%prin%superconcepte%partajate:% atunci%când%un%concept%poate%fi%aliniat%la%mai%multe% alternaCve,%se%iau%în%considerare%cele%ale%căror% superconcepte%sunt%cumva%aliniate%la% superconceptele%conceptului%țintă %% – Măsuri%bazate%pe%distanțe%semanCce%(număr%de% legături)%(v %(Agirre%et%al ,%1994)) %% Măsuri%de%aliniere% • Potrivire%de%nume%(cognate$match):%compară% numele%N1%și%N2%ale%două%concepte %% – Consideră%subșiruri%descrescătoare%ale%lui%N1,%tăind% din%stânga %Numele%formate%din%cuvinte%compuse% sunt%împărțite%în%cuvinte%separate,%se%întoarce%scorul% maxim %Numele%mai%mici%de%3%litere%sunt%ignorate %% • NAMESCORE: = numărul de litere potrivite la pătrat + 20 de puncte dacă cuvintele sunt exact egale sau 10 puncte dacă cuvintele coincid la sfârșit Măsuri%de%aliniere:%% exemple%de%sugesCi%de%potriviri'de'nume'cu%scoruri% (alignval ‘|S@cuisine| ‘( (NAME M@LIMOUSINE 26) (NAME M@VINE 19) (NAME M@MORPHINE 19) (NAME M@ENGINE-GOVERNOR 19) (NAME M@BUSINESS-COVERAGE-OF 16) (NAME M@AGRIBUSINESS-ACTIVITY 16) (NAME M@TABLE-LINEN 9) (NAME M@TRAINER 9) 120 more )) (alignval ‘|S@Free World| ‘( (NAME M@PERCENT-OF-WORLD-POPULATION 46) (NAME M@WORLD 35) )) Măsuri%de%aliniere% • Potriviri%pe%definiții:%compară%definițiile%în%engleză% D1%și%D2%ale%două%concepte %Mai%întâi,%ambele% definiții%sunt%separate%in%cuvinte%separate%(se% îndepărtează%apostroafele,%limioarele%de%unire% etc )%și%toate%cuvintele%sunt%lemaCzate % – definiția%lui%M@FOOD:%("any"%"substance"%"that"%"can"%"be"% "metabolized"%"organism"%"give"%"energy"%"build"%"Cssue")%% – apoi,%se%calculează%3%valori:%% • strength%=%raportul%dintre%numărul%de%cuvinte%care%apar%în%ambele% definiții%și%numărul%de%cuvinte%ale%definiției%cele%mai%scurte,%% • reliability%=%numărul%de%cuvinte%comune,% • defscore%=%strength%*%reliability:% %% • DEFSCORE%:=%(Shared(D1,D2)%/%min{D1,D2})*Shared(D1,D2)%% Măsuri%de%aliniere:%% exemple%de%sugesCi%de%potriviri'de'definiții' cu%scoruri% (strength, reliability, score): (alignval ‘|S@cuisine| ‘( (DEF M@KITCHEN (0 62 5 3 12)) (DEF M@CHEESE (0 62 5 3 12)) (DEF M@FOODSTUFF (0 62 5 3 12)) (DEF M@PET-FOOD (0 62 5 3 12)) (DEF M@CUTLERY (0 50 4 2 00)) (DEF M@RACETRACK ( 0 37 3 1 12)) (DEF M@COOK ( 0 40 2 0 80)) 5 more )) Măsuri%de%aliniere% • Potrivire%TAXONOMICĂ%(între%ontologiile% SENSUS%și%MIKROKOSMOS):%pentru%un%anumit% concept%SENSUS,%colectează%toate%conceptele% din%MIKROKOSMOS%care%sunt%"mai%apropiate"% de%10%link-uri%de%el %Algoritmul%traversează% taxonomia%atât%în%€€direcțiile%superconcept%cât% și%în%subconcepte %% – Scorul%de%potrivire%este%dat%de%inversa%link- distanței:% – %TAXSCORE := 1 / number-of-links Măsuri%de%aliniere:%% exemple%de%sugesCi%de%potriviri'de' taxonomie%cu%scoruri% (alignval ‘|S@end>come out| ‘((TAX M@SOCIAL-EVENT 0 17) (TAX M@EMANATE 0 17) (TAX M@EMIT-LIGHT 0 17) (TAX M@EMIT-SOUND 0 17) (TAX M@REFLECT-LIGHT 0 17) (TAX M@EXTRACT 0 17) (TAX M@APPLY-FORCE 0 20) (TAX M@PACK 0 20) 22 more )) Combinarea%scorurilor% • CaracterisCcile%formulelor%de%combinare:%% – să%crească%cu%valori%în%creștere%ale%NAME,%DEF%și%TAX%% – să%normalizeze%scorurile%eurisCcilor%% – să%diminueze%tendința%scorurilor%NAME%de%a%crește%rapid% – să%atenuarea%tendința%scorurilor%de%TAXONOMIE%de% diminuare%rapidă%% – să%întoarcă%un%scor%nenul%dacă%cel%puțin%o%eurisCcă%întoarce% un%scor%nenul% • SCORE := sqrt(NAMESCORE) * DEFSCORE * (10 * TAXSCORE) cu%grija%că%dacă%NAMESCORE%sau%DEFSCORE%sunt%zero,%ele%sunt%înlocuite%prin% 1,%și%dacă%TAXSCORE%e%0,%el%e%înlocuit%prin%0 01 %% % Uzual,%scorurile%de%aliniere%se%plasează%în%scara%0%–%16 % % %% Generarea'întrebărilor%% Generarea%întrebărior%% (ques>on$genera>on%–%QG):%%% un%subdomeniu%al%IA% • Generarea%de%întrebări%mulC-variante%din%ontologii% (MCQG)%% – pentru%evaluarea%studenților% – beneficii%pentru%instructori:%% • sarcina%de%a%construi%manual%MCQ%pentru%teste%este%greoaie%și% consumatoare%de%Cmp%% • este%adesea%dificil%să%se%dezvolte%arCcole%MCQ%de%înaltă%calitate% – sisteme%de%MCQ%care%pleacă%de%la%ontologii%reușesc%să% genereze%arCcole%MCQ%% • DAR:%cât%de%bine%slujest%aceste%artefacte%procesului%educațional?%% Generatorul%de%întrebări% • Scopul%întrebărilor:%% – evaluare,%% – revizuiri%sau%întrebări%de%studiu,%% – exercițiul%de%a%pune%întrebări,%% – întrebări%de%rezolvare%a%problemelor,%% – întrebări%generale%într-un%domeniu%specific,%cum% ar%fi%turismul,%% – sau%întrebări%dintr-un%domeniu%deschis% Sisteme%de%QG% • Pe%bază%de%sintaxă%(unele%dintre%primele):%% – parser%de%limbaj%natural%folosit%pentru%a%analiza%sintaxa% frazei%și%a%idenCfica%componentele%majore%care%pot%fi% folosite%pentru%a%forma%o%întrebare %% – dezavantaje:%% • propoziții%sintacCc%ambigue%(singura%modalitate%de%a%analiza%corect% as‚el%de%propoziții%este%de%a%înțelege%semnificația%lor)% • sistemul%este%dependent%de%limbă%% – avantaje:%% • este%independent%de%domeniu,%as‚el%încât%pentru%a%formula%o% întrebare%în%orice%domeniu%trebuie%formulată%o%propoziție%în%limba% naturală%dată% OG%systems% • Abordări%bazate%pe%semanCcă%-%de%obicei,% dependente%de%domeniu:%folosesc%un%model% semanCc%al%domeniului%pentru%a%genera%întrebări %% – OntAWare:%% • folosește%o%ontologie%și%generează%întrebări%bazate%pe% cunoașterea%relațiilor%dintre%clasă-subclasă%și%dintre%clasă- instanță %% • oferă,%printre%alte%funcționalități%pentru%redactarea% conținutului%educațional,%generarea%semiautomaCcă%a% obiectelor%de%învățare,%inclusiv%întrebări %% • folosește%relațiile%de%subsumare%între%clase%pentru%a%genera% întrebări,%cum%ar%fi:%"Care%dintre%următoarele%elemente%este% (sau%nu%este)%un%exemplu%al%conceptului,%X?”% PaXernuri%în%generarea%testelor% Žitko%B,%Stankov%S,%Rosić%M,%Grubišić%A %(2009)%Dynamic%test%generaCon%over% ontology-based%knowledge%representaCon%in%authoring%shell %Expert$Systems$ with$Applica>ons %36:8185–8196 %% • Teste%generate%pe%baza%cunoșCnțelor%de% domeniu%exprimate%în%ontologii%OWL:%% – un%număr%de%șabloane%definite%pentru%întrebări% sunt%uClizate%de%sistem%pentru%a%genera% elementele%de%testare%